不懂这些术语,还好意思叫数据存储专业人士?
存储行业充斥着大量的缩略词和专业术语,本文给出了一份速查表。
在过去几年,IT行业创造的缩略词比美国政府创造的还多。我甚至并不以所有的“XaaS”(X即服务)术语开头!这年头,缩略词满天飞,存储行业也不例外。当然,大多数缩略词隐藏着重大的技术进步,存储行业最近取得了长足发展。
不妨先看一看如今市面上各种类型的存储驱动器。
硬盘驱动器(HDD):HDD是我们使用了几十年的传统旋转驱动器。它们主要有两种尺寸:直径3.5英寸的介质和直径2.5英寸的介质,后者面积较小,而且薄得多。
固态硬盘(SSD):SSD正在迅速取代主存储层中的HDD。不像HDD,这种驱动器没有活动部件,将数据存储在闪存芯片上。SSD的速度比HDD快得多,大概要快100倍到1000倍之间。
闪存卡:这种PCIe插卡在系统看来如同超高速的SSD。
驱动器接口取得有了长足发展,不再是昔日的SCSI(小型计算机系统接口)和光纤通道唱主角。主要的驱动器接口包括如下:
SATA:串行ATA(SATA)取代了上世纪90年代的平行连线的ATA接口。它仅用四条线来传输数据。如今,厂商提供的数据传输速率可高达12 Gbps,正在计划研制24Gbps的技术。
SAS:串行连接SCSI(SAS)是SATA的高端版本。它用在企业级HDD上,为双端口连接提供了选择,确保冗余性,但在其他方面与SATA有着同样的许多功能。大多数SAS接口可以连接到SATA驱动器,不过SATA接口无法连接到SAS驱动器。
PCIe/NVMe:这个术语太拗口了!PCIe体现了用在主板上连接附加卡的高速互连技术,而非易失性存储器标准(NVMe)是一种新的低开销协议,它使用存储器到存储器操作(参阅下面的RDMA),性能比SAS高出4倍。
服务器中的驱动器通过三种方式来连接:主板上的端口、提供众多端口的I/O扩展器,或者通过RAID控制器或主机总线适配器。最后这种解决方案通常基于SAS,经配置后还可以连接到名为JBOD(简单磁盘捆绑)的外部驱动器盒。要注意的是,SAS外部接口使用的电压与内部端口不一样。
存储常常作为一种网络连接解决方案而出现。这里,驱动器盒通过使用众多接口的控制器(如今这通常是商用现成主板)连接到主机服务器。这有几种类型:
全闪存阵列(AFA):AFA是复杂控制器后面的一堆闪存设备,这种控制器通常是商用现成(COTS)主板。它是为了轻松安装到光纤通道存储区域网(SAN)存储系统而设计的,大大提升了性能,现在变得非常流行。
RAID阵列:这是传统的驱动器盒外加控制器。独立磁盘冗余阵列(RAID)阵列主要使用HDD;如果它们使用一些SSD,就被称为混合阵列。
专用设备(appliance):由于驱动器因使用SSD而变得更庞大、速度大大加快,业界在改用紧凑的专用设备盒,驱动器数量较少,通常是10个至12个。专用设备兼顾了网络性能、处理能力和驱动器性能。
存储领域让情况更为复杂的是,还有一套不同于驱动器接口的网络存储协议。最常见的网络存储协议包括:
光纤通道:光纤通道是90年代开发的一种串行技术,用来替代SCSI。光纤通道的使用已变成复杂的阵列和服务器用SAN连接起来。IBM有自家版本的这种技术,名为FICON(光纤连接)。
iSCSI:一种使用SCSI命令集的基于以太网的协议。
FCoE:一种基于以太网的光纤通道,现在已落到废弃的田地。
InfiniBand:InfiniBand在运行时操作系统的开销非常低,使用RDMA来传输数据。它用于低延迟使用场合,比如交易大厅系统。
NOF:NVMe over Fabrics是一种新兴协议,使用NVMe以及PCIe、以太网,甚至Infiniband。拥有相似的RDMA性能,它可能会取代旧的InfiniBand解决方案。
图片来源:PeteLinforth / Pixabay
还有另外几个存储术语需要了解。先来介绍查找和访问特定数据项的一些方法。
对象存储:对象存储是用扁平索引系统存储数据对象的一种方法,具有可无限扩展的优点。它是非结构化大数据应用的最选选择,有望在未来几年取代文件存储。
数据块I/O:这是面向SAN的访问方法。数据块I/O数据寻址模拟大型驱动器,分成多个逻辑单元(名为LUN)。容量增加后,访问会变得很笨拙。
文件存储:又叫网络连接存储(SAN)或文件管理器(filer),这是计算机里面文件系统的扩展,文件系统驻留在上面,由文件管理器而不是由数据块I/O来处理,服务器则处理寻址方案。
通用存储:这种方法结合了所有三种访问方法,通常驻留在Ceph之类的对象存储系统上。说到更换其他方法,这种通用性应该足以让通用方法成为一种首选的方法。
此外还有用于描述存储设备中功能的一些常见术语。
RDMA:RDMA(远程直接内存访问)是一种接口机制,用于两台计算机的主内存之间的直接传输。这加快了传输速度,又大大降低了计算机处理事务的开销。它可以应用于许多存储协议。
压缩:大多数数据可以压缩,平均可压缩5倍左右。这减小了存储数据的原始容量,不过代价是比较复杂、性能下降。随着技术不断加快处理速度,预计加密做法会变得极其普遍。
重复数据删除:重复数据删除是一种类似压缩的过程,它只存储单单一组用来参考的任何对象,指向公共对象的指针取代系统中的其他副本。这可以大幅节省存储空间。一个例子就是,为数百个桌面只保留一个镜像。它有时与压缩混为一谈,连大公司也互换使用这两个术语,但是重复数据删除的过程略有不同。
加密:数据在静态存储时需要保护起来。想满足大多数合规要求,基于源端的加密是唯一切实可行的解决方案。
索引:存储市场的一个新概念就是,将数据搜索和索引与备份方法结合起来。比如说,这种技术使用备份系统中可用的巨大带宽,在法律和病历环境下节省成本和时间。
SDS:软件定义存储(SDS)是一个新概念,它是指将存储数据的处理与实际存储设备分离开来。这种分离让存储服务得以根据需要来实现虚拟化、加以扩展,因而提高了操作灵活性。
如今,存储行业发生变化的速度比以往任何时候都要快,所以预计在不远的将来会出现更多术语,请密切关注。
云头条编译|未经授权谢绝转载
相关阅读:
闪存自助模式失败?NetApp 8.7亿美元收购 SolidFire